উদাহরণ সহ Image, Video, এবং Audio ফাইল থেকে Metadata এক্সট্র্যাক্ট করা

Metadata Extraction - অ্যাপাচি টিকা (Apache Tika) - Java Technologies

296

Apache Tika একটি শক্তিশালী ওপেন সোর্স লাইব্রেরি যা বিভিন্ন ফাইল ফরম্যাট যেমন image, video, এবং audio ফাইল থেকে মেটাডেটা এক্সট্র্যাক্ট করতে সক্ষম। এটি metadata extraction এর জন্য বিভিন্ন ফরম্যাট সাপোর্ট করে, যেমন JPEG, PNG, MP3, MP4, WAV, ইত্যাদি। Apache Tika এর মাধ্যমে আপনি ছবি, ভিডিও এবং অডিও ফাইলের মেটাডেটা যেমন ফাইলের আকার, টাইপ, নির্মাতা, সৃষ্টি তারিখ, প্রোপার্টি, এবং অন্যান্য বিভিন্ন তথ্য বের করতে পারেন।

এখানে, আমরা Apache Tika ব্যবহার করে কিভাবে image, video, এবং audio ফাইল থেকে মেটাডেটা এক্সট্র্যাক্ট করা যায়, তার উদাহরণ দেখাবো।


Maven Dependency for Apache Tika

প্রথমে, আপনার প্রজেক্টে Apache Tika লাইব্রেরি যুক্ত করতে হবে। যদি আপনি Maven ব্যবহার করেন, তাহলে pom.xml ফাইলে নিচের ডিপেনডেন্সি যোগ করুন:

<dependencies>
    <dependency>
        <groupId>org.apache.tika</groupId>
        <artifactId>tika-core</artifactId>
        <version>2.5.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.tika</groupId>
        <artifactId>tika-parsers</artifactId>
        <version>2.5.0</version>
    </dependency>
</dependencies>

এটি Tika এর সকল প্রয়োজনীয় পার্সার এবং কোর কম্পোনেন্ট যোগ করবে।


1. Image File থেকে Metadata Extraction

উদাহরণ: JPEG Image থেকে Metadata এক্সট্র্যাক্ট করা

Apache Tika ব্যবহার করে JPEG ইমেজ ফাইল থেকে মেটাডেটা এক্সট্র্যাক্ট করার জন্য নিচের কোডটি ব্যবহার করতে পারেন।

Java কোড:

import org.apache.tika.Tika;
import org.apache.tika.metadata.Metadata;
import java.io.File;
import java.io.IOException;

public class ImageMetadataExample {
    public static void main(String[] args) {
        try {
            // Tika instance
            Tika tika = new Tika();

            // Create Metadata object
            Metadata metadata = new Metadata();

            // Provide the image file path (e.g., example.jpg)
            File file = new File("example.jpg");

            // Extract metadata
            tika.parse(file, metadata);

            // Print metadata details
            System.out.println("Image Metadata:");
            String[] metadataNames = metadata.names();
            for (String name : metadataNames) {
                System.out.println(name + ": " + metadata.get(name));
            }

        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

ব্যাখ্যা:

  • Tika: এটি ফাইলের কন্টেন্ট এবং মেটাডেটা এক্সট্র্যাক্ট করতে ব্যবহৃত হয়।
  • Metadata: মেটাডেটা অবজেক্ট যা ফাইলের বিভিন্ন মেটাডেটা সংগ্রহ করে।

আউটপুট:

Image Metadata:
Image Height: 1024
Image Width: 768
Author: John Doe
Date: 2023-05-12T14:30:00Z
...

2. Audio File থেকে Metadata Extraction

উদাহরণ: MP3 Audio File থেকে Metadata এক্সট্র্যাক্ট করা

এখন, MP3 অডিও ফাইল থেকে মেটাডেটা এক্সট্র্যাক্ট করার জন্য একই পদ্ধতি ব্যবহার করা যাবে।

Java কোড:

import org.apache.tika.Tika;
import org.apache.tika.metadata.Metadata;
import java.io.File;
import java.io.IOException;

public class AudioMetadataExample {
    public static void main(String[] args) {
        try {
            // Tika instance
            Tika tika = new Tika();

            // Create Metadata object
            Metadata metadata = new Metadata();

            // Provide the audio file path (e.g., example.mp3)
            File file = new File("example.mp3");

            // Extract metadata
            tika.parse(file, metadata);

            // Print metadata details
            System.out.println("Audio Metadata:");
            String[] metadataNames = metadata.names();
            for (String name : metadataNames) {
                System.out.println(name + ": " + metadata.get(name));
            }

        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

ব্যাখ্যা:

এখানে, Tika অডিও ফাইলের মেটাডেটা এক্সট্র্যাক্ট করার জন্য MP3 ফাইলের তথ্য বের করছে, যেমন ফাইলের শিরোনাম, শিল্পী, এবং অ্যালবামের নাম।

আউটপুট:

Audio Metadata:
xmpDM:album: Greatest Hits
xmpDM:composer: John Doe
xmpDM:creator: John Doe
xmpDM:trackNumber: 5
...

3. Video File থেকে Metadata Extraction

উদাহরণ: MP4 Video File থেকে Metadata এক্সট্র্যাক্ট করা

এখন, MP4 ভিডিও ফাইল থেকে মেটাডেটা এক্সট্র্যাক্ট করার উদাহরণ দেখানো হবে।

Java কোড:

import org.apache.tika.Tika;
import org.apache.tika.metadata.Metadata;
import java.io.File;
import java.io.IOException;

public class VideoMetadataExample {
    public static void main(String[] args) {
        try {
            // Tika instance
            Tika tika = new Tika();

            // Create Metadata object
            Metadata metadata = new Metadata();

            // Provide the video file path (e.g., example.mp4)
            File file = new File("example.mp4");

            // Extract metadata
            tika.parse(file, metadata);

            // Print metadata details
            System.out.println("Video Metadata:");
            String[] metadataNames = metadata.names();
            for (String name : metadataNames) {
                System.out.println(name + ": " + metadata.get(name));
            }

        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

ব্যাখ্যা:

এখানে, Tika ব্যবহার করে MP4 ভিডিও ফাইল থেকে বিভিন্ন মেটাডেটা (যেমন: ভিডিওর রেজোলিউশন, ফ্রেম রেট, শিরোনাম, নির্মাতা ইত্যাদি) এক্সট্র্যাক্ট করা হচ্ছে।

আউটপুট:

Video Metadata:
xmpDM:videoFrameSize: 1920x1080
xmpDM:duration: 300
xmpDM:creator: John Doe
xmpDM:title: Amazing Video
...

Apache Tika এর সুবিধা

  1. Multiple Formats Support: Apache Tika বিভিন্ন ফাইল ফরম্যাট যেমন JPEG, MP3, MP4, WAV, PNG, ইত্যাদি থেকে মেটাডেটা এক্সট্র্যাক্ট করতে পারে।
  2. Ease of Use: Tika ব্যবহার করা খুবই সহজ, এবং এটি Java বা অন্যান্য ভাষার অ্যাপ্লিকেশনগুলির সঙ্গে সহজে ইন্টিগ্রেট করা যায়।
  3. Comprehensive Metadata Extraction: Tika শুধুমাত্র ফাইল কন্টেন্ট এক্সট্র্যাক্ট করে না, বরং ফাইলের মেটাডেটাও এক্সট্র্যাক্ট করে।
  4. File Magic and Header Support: Tika ফাইলের সঠিক টাইপ সনাক্ত করতে magic numbers এবং file headers ব্যবহার করে।

সারাংশ

Apache Tika একটি অত্যন্ত কার্যকরী এবং ফিচার-প্যাকড লাইব্রেরি যা বিভিন্ন ধরনের image, audio, এবং video ফাইল থেকে মেটাডেটা এক্সট্র্যাক্ট করতে সাহায্য করে। Tika ফাইলের কন্টেন্ট এক্সট্র্যাক্ট করার পাশাপাশি মেটাডেটা যেমন author, title, duration, resolution ইত্যাদি এক্সট্র্যাক্ট করতে সক্ষম। এটি Java এবং অন্যান্য প্ল্যাটফর্মে সহজে ইন্টিগ্রেট করা যায়, যা ডেটা প্রক্রিয়াকরণ এবং বিশ্লেষণের জন্য একটি শক্তিশালী টুল হিসেবে ব্যবহৃত হয়।

Content added By
Promotion

Are you sure to start over?

Loading...